這個大類別的設計邏輯是:從簡單到複雜、從描述到預測、從單變項到多變項、從統計檢驗到機器學習。
先用統計方法分析基礎現象,逐步引入迴歸、生存分析,再到決策樹、隨機森林、支持向量機等 AI 方法,最後用結構方程模型整合因果與路徑。這樣的設計能讓健康與社會研究兼具可解釋性(explainability)與預測力(predictive power)。
專有名詞解釋:用來呈現資料的基本特徵,如平均數、中位數、標準差、比例。
緣由:在健康研究中,先了解受試者的年齡、教育、收入分布,才能掌握研究背景。
例子:比較不同教育程度的長者平均 BMI,或呈現婚姻狀態的比例。
專有名詞解釋:用抽樣資料來檢驗群體差異,例如 t-test、ANOVA。
緣由:檢驗教育程度或收入是否與體適能有顯著差異。
例子:用 ANOVA 比較「高收入、中收入、低收入」三組長者的握力差異。
專有名詞解釋:檢視兩個類別變項的交互關係。
緣由:婚姻與居住狀態可能交互影響健康行為。
例子:單身獨居 vs. 已婚同住 → 規律運動比例的差異。
專有名詞解釋:探討多個自變項對一個連續依變項的影響。
緣由:教育與收入同時影響體適能,需要控制混雜因子。
例子:教育、收入、年齡對 6 分鐘步行測驗距離的影響。
專有名詞解釋:用於二元結果(yes/no)的機率預測。
緣由:預測長者是否有慢性病風險。
例子:以運動習慣、教育收入預測「是否患有高血壓」。
專有名詞解釋:分析「事件發生時間」與風險因子的關係。
緣由:研究居住狀態與長照需求出現的時間差異。
例子:獨居長者 vs. 同住長者 → 進入長照機構的平均年限差異。
專有名詞解釋:用樹狀結構依規則分群。
緣由:易於解釋,能直觀呈現影響健康的路徑。
例子:教育程度 + 運動習慣 → 體適能高低分類。
專有名詞解釋:整合多棵決策樹提升準確率的集成學習方法。
緣由:用於辨識體適能影響的關鍵因子,避免單一決策樹的偏差。
例子:判斷因子,誰最影響握力。
專有名詞解釋:一種分類方法,尋找最佳超平面分隔不同群體。
緣由:區分婚姻狀態下的健康與不健康群組。
例子:輸入 BMI、運動頻率、教育 → 分群「健康 vs. 不健康」。
專有名詞解釋:結合迴歸與因子分析,探討多重因果路徑。
緣由:教育收入可能同時影響體適能,也透過「運動習慣」間接影響。
例子:教育 → 運動習慣 → 體適能;收入 → 健康資源 → 體適能。
這個方法論基礎大類別是循序漸進的:
基礎描述(了解現況)
統計檢驗(驗證差異)
迴歸與生存分析(探討因果與時間)
機器學習(分類與預測)
整合模型(建構多重路徑)
它能兼顧「實證研究」與「預測應用」,並對健康與社會變項的交互關係提供清楚分析路徑。